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Prufungsantrag gem. § 44 PatG ist gestellt 

@ Verfahren zum Ubertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale 

(§) Zum Ubertragen oder Speichern digitalisierter, mehrkana- 
liger Tonsignale die durch eine Vielzaht spektraler Teilbands- 
ignale digital dargestellt sind werden encoderseitig die 
Teilbandsignale verschiedener Tonkanale. jedoch gleicher 
Frequenzlage interkanalweise nach Ma&gabe eines dynami- 
schen Steuersignafs kombiniert. Dieses Steuersignal wird 
durch eine an einem binauralen, psychoakustischen Modell 
orientierten Tonstgnalanalyse von mehreren Tonkanalen ge- 
wonnen. Decoderseitig werden die Teilbandsignale verschie- 
dener Tonkanale. jedoch gleicher Frequenzlage interkanal- 
weise in Abhangigkeit von einer Steuergro&e dekombiniert, 
we I che von dem dynamischen Steuersignal abgeteitet und 
mitObertragen bzw. mitgespeichert wird (Fig. 3). 
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Beschreibung 


Die Erfindung bezieht sich auf ein Verfahren gemaB 
dem Oberbegriff der nebengeordneten Anspruche 1,12 
und 14. 

Fur die Obertragung und Speicherung digitaler Ton- 
signale ist es bekannt (DE 34 40 613 und DE 36 39 753), 
mit Hilfe einer Codierung in Teilbandern und der An- 
wendung eines psychoakustischen Modells eine Daten- 
reduktion vorzunehmen. Dabei wird das digitalisierte, 
breitbandige Tonsignal durch eine Vielzahl spektraler 
Teilbandsignale dargestellt, wobei die Quamisierung 
der Abtastwerte in den einzelnen Teilbandern nach 
MaBgabe der Mithorschwelle des menschlichen Gehors 
erfolgt. Der mit dieser "monofonen Codierung" erreich- 
bare Datenreduktionsfaktor fiir sehr hochwertige Au- 
diosignale hat bei 48 kHz Abtastfrequenz und 16 bit-li- 
nearer Quantisierung etwa den Wert 6, was einer Da- 
tenrate von 2x I28kbit/s pro stereofones Tonsignal 
entspricht. 

Bekannt sind ferner MaBnahmen zur Steigerung des 
Datenreduktionsfaktors bei der Codierung zweikanali- 
ger f stereofoner Signale. welche darauf beruhen, redun- 
dante Signalanteile im linken und rechten Kanal sowie 
solche Anteile zu unterdriicken, die beziiglich der ste- 
reofonen Wirkung irrelevant sind. Zwei unterschiedli- 
che Ausfuhrungsformen dieser "stereofonen Codierung" 
sind in der europaischen Patentanmeidung Nr. 90 00 338 
sowie in "Proceedings of the ICASP 1990 n "Perceptual 
Transform Coding of Wideband Stereo Signals'* be- 
schrieben, namlich 

— zeitweise Obertragung von Teilband-Summen- 
signalen im oberen Frequenzbereich und blockwei- 
se Rekonstruktion der Teilband-Signalpegel im lin- 
ken und rechten Kanal mit Hilfe von Skalenfakto- 
ren, welche die maximalen Signalpegel in den Teil- 
bandern der linken und rechten Tonkanale repra- 
sentieren, und 

— Bildung von Summen-(M = MONO)- und Diffe- 
renz-(S « SEITEN)-Signalen aus dem linken (L) und 
rechten (R) Tonsignal gemaB der Matrizierung 
M = L+ R und S — L - R, wobei nach MaBgabe der 
fur das Summensignal M ermittelten Mithor- 
schwelle die Decodierung der Summen- und Diffe- 
renzsignale erfolgt. 

Wird die getrennte Codierung in den Teilbandern des 
linken und rechten Tonkanals durch die stereofone Co- 
dierung in der Weise erganzt, daB eine dieser Methoden 
oder eine Kombination aus beiden Methoden ange- 
wandt wird, so laBt sich der Datenreduktionsfaktor von 
dem Wert 6 auf etwa den Wert 8 steigern. Ist beispiels- 
weise fiir die Obertragung von zwei unabhangigen Mo- 
nosignalen mit derselben Qualitat wie eine 16 bit-lineare 
Quantisiei;ung eine Bitrate von 256 kbit/s erforderlich, 
so sind bei stereofoner Codierung fur die Obertragung 
eines zweikanaligen Stereosignals derselben subjekti- 
ven Qualitat nur 192 kbit/s erforderlich. 

Demgegeniiber besteht die Aufgabe der Erfindung 
darin, eine noch starkere Datenreduktion bei zweikana- 
ligen oder mehrkanaligen stereofonen Signalen zu er- 
reichen. 

Diese Aufgabe wird erfindungsgemaB durch die 
kennzeichnenden Merkmale der nebengeordneten An- 
spruche 1,12 oder 1 4 gelost. 

Vorteilhafte Ausgestaltungen und Weiterbildungen 
des erfindungsgemaBen Verfahrens ergeben sich aus 


den Unteranspruchen. 

Die Erfindung geht von der Oberlegung aus, daB sich 
die Bitrate fur ein teilbandcodiertes, stereofones Signal 
noch betrachtlich weiter senken laBt, wenn diverse Pha- 
5 nomene des raumlichen Horens und bekannte Modelle 
der binauralen Signalverarbeitung im menschlichen Ge- 
hor berucksichtigt werden. Es zeigt sich namlich, daB ein 
hoher Informationsanteil des stereofonen Signals irrele- 
vant ist. Insbesondere kann das menschliche Gehor fiir 
io bestimmte spektrale Komponenten und innerhalb be- 
stimmter Zeitintervalle keine raumlichen Unterschiede 
wahrnehmen, d. h„ innerhalb bestimmter Zeitintervalle 
ist fur bestimmte Spektralbereiche eine vollstandige 
Kanaltrennung nicht notwendig. Ferner kann infolge 
is des Effektes der "Nachbarkanal-Verdeckung" die Quan- 
tisierung oder Unterdriickung einzelner Teilbandsigna- 
le nach MaBgabe der hochsten Nachbarkanal-Mithor- 
schwelle erfolgen, wenn die zugehorige Gleichkanal- 
Mithorschwelle niedriger liegt Allerdings muB fur die 
20 Nutzung der Nachbarkanal-Verdeckung der Effekt ei- 
ner reduzierten Verdeckung bei raumlich getrennten 
Maskierern ("Masking Level Difference", MLD) beruck- 
sichtigt und daher die Wiedergabeanordnung definiert 
werden. Eine derartige Optimierung der stereofonen 
25 Codierung hat insbesondere bei zukunftigen digitalen 
Tonsystemen mit einer hoheren Anzahl von Obertra- 
gungs- und Wiedergabekanalen eine besondere Bedeu- 
tung. Mit der Erhohung der Anzahl der Tonkanale las- 
sen sich die Richtungsstabilitat der Tondarstellung im 
30 Abbildungsbereich zwischen den vorderen Lautspre- 
chern sowie die Moglichkeiten der raumlichen Tondar- 
stellung steigern. Hierzu werden beispielsweise der lin- 
ke und rechte Lautsprecher durch einen Center- sowie 
zwei Surround-Lautsprecher erganzt, so daB drei weite- 
35 re Toniibertragungskanale erforderlich sind. Eine mit 
der Steigerung der Kanalzahl proportional wachsende 
Bitrate stellt in vielen Fallen eine zu hohe Belastung der 
Obertragungskapazitat dar. Beispielsweise ware bereits 
eine Verdopplung der Bitrate fur zusatzliche Center- 
40 und Surroundkanale im zukunftigen digitalen Horfunk 
nicht akzeptabel, wenn die Anzahl der Programme ent- 
sprechend halbiert werden muBte. 

Es wird daher speziell angestrebt, die Bitrate fiir fiinf- 
kanalige, stereofone Tonsignale (3 Frontsignale L 
45 (Links), C (Center), R (Rechts) und 2 Surroundsignale LS 
(Links-Surround), RS (Rechts- Surround); abgekurzt mit 
w 312-Stereosignale" von 5 x (192:2) * 480 kbit/s auf et- 
wa 300 kbit/s zu verringern. Eine wichtige Bedingung 
fur die Einfuhrung mehrkanaliger Toniibertragungssy- 
so steme ist in vielen Fallen die Kompatibilitat mit vorhan- 
denen digitalen Zweikanal-Stereoempfangern. Da die 
Obertragungskapazitat oft zu begrenzt ist, um entspre- 
chend dem Simulcast-Prinzip neben dem konventionel- 
len Zweikanal-Signal gemaB ISO/EMPEC-Standard 
55 1 1 172-3 ein vollstandiges Mehrkanal-Signal zu iibertra- 
gen, muB mit Hilfe von Kompatibilitatsmatrizierungen 
vor der Obertragung aus dem Mehrkanal-Stereosignal 
ein Zweikanal-Stereo-Basissignal Lo, Ro gewonnen 
werden, welches fiir die Wiedergabe mit Zweikanal-Ste- 
60 reoempfangern geeignet ist. Fur eine Kompatibilitats- 
matrizierung fur fiinfkanalige (3/2)-Stereosignale kann 
beispielsweise folgendes Gleichungssystem vorgesehen 
werden: 

65 Tl - L + xC + yLS = Lo (1) 
T2 - R + xC + yRS - Ro (2) 
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T3 - xC (3) 
T4 - yLS (4) 
T5 - yRS (5) 

wobei x und y Koeffizienten im Bereich von beispiels- 
weise 0,5 bis 0,8 sind. 

Die Obertragungssignale Tl und T2 bilden das Zwei- 
kanal- Stereo- Basissignalpaket Lo/Ro f wahrend die zu- 
satzlichen Obertragungssignale T3, T4, T5 die fur die 
Dematrizierungen notwendige Information enthalten. 
Sollen die ursprUnglichen fUnfkanaligen Stereosignale 
UQR, LS, RS decoderseitig wieder vollstandig rekon- 
struiert werden, so lautet die Dematrizierungsvor- 
schrift: 

L' = Tl - T3 - T4 (6) 

R' - T2 - T3 - T5 (7) 

C - T3/x (8) 

LS' - T4/y (9) 

RS' = T5/y (10) 

Eine vollstandige Rekonstruktion der ursprUnglichen 
fUnfkanaligen Stereosignale ist jedoch nicht notwendig, 
da — wie schon erwahnt — das Gehor innerhalb be- 
stimmter Zeitintervalle fUr bestimmte Spektralbereiche 
eine unvollstandige Kanaltrennung tolerien. Dement- 
sprechend konnen bestimmte Teilbandsignale der 
Ubertragungssignale T3, T4 und T5 in den Gleichungen 
(3), (4) und (5) zeitweise und signalabhangig zu Null 
gesetzt werden (sogenannte "Punktierung"). Eine weite* 
re Oberlegung besteht daher darin, die Datenrate fur 
das Zusatzsignalpaket T3/T4/T5 so weit wie moglich zu 
senken, indem ausschlieBlich die fUr die raumliche 
Wahrnehmung relevanten Signalanteile extrahiert wer- 
den. Die Codierung der Stereo- Basissignale Lo und Ro 
bleibt hiervon unberuhru so daB Kompatibilitat mit be- 
stehenden Zweikanal-Decodern gewahrleistet ist. An- 
stelle einer mehrkanaligen Tondarstellung lassen sich 
auch mehrsprachige, einfache Programme oder Kom- 
memarkanale vorsehen, insbesondere fur die Anwen- 
dung in zukUnftigen Fernsehsystemen mit digitalem 
Ton. In diesem Fall wird keine Matrizierung vorgese- 
hen. 

Die Erfindung wird nachstehend anhand von AusfUh- 
rungsbeispielen in den Zeichnungen nSher erlautert. Es 
zeigt: 

Fig. 1 ein Grundschema eines Encoders zur encoder- 
seitigen DurchfUhrung des erfindungsgemaBen Verfah- 
rens; 

Fig. 2 ein Grundschema eines Decoders zur decoder- 
seitigen DurchfUhrung des erfindungsgemaBen Verfah- 
rens; 

Fig. 3 und 5 jeweils ein Grundschema eines kompati- 
blen Encoders fur funfkanalige, stereofoneTonsignale; 

Fig. 4 und 6 jeweils ein Grundschema eines kompati- 
blen Decoders fUr funfkanalige, stereofone Tonsignale 
und 

Fig. 7 ein Modell der binauralen Signalverarbeitung 
des menschlichen Gehors. 

Bei der Erfindung werden neben der Redundanz vor 
allem die Grenzen des Gehors bei der raumlichen Ana- 
lyse des Schallfeldes im Sinne einer stereofonen Codie- 


rung moglichst vollstandig genutzt, indem die Bitzuwei- 
sung fur individuelle Teilbfcnder einzelner Tonkan&le 
blockweise nach MaBgabe einer gemeinsamen Analyse 
der stereofonen Signale aller Tonkanale erfolgt. Hierbei 
5 wird die Quantisierung nicht nur unter Berucksichti- 
gung der Nachbarkanal-Verdeckung festgelegv son- 
dern da ruber hinaus unter Berticksichtigung der subjek- 
tiv hinreichenden Kanaltrennung, wie im folgenden na- 
her dargelegt werden soil. 

io Eine signalabhangig gesteuerte, gehorangepaBte, 
blockweise Reduktion der Kanaltrennung individueller 
Teilbandsignale fuhrt zu entsprechender Datenreduk- 
tion, wenn die im Encoder zu "mono" gesetzten Teil- 
bandsignale nur in einem der Kanale ubertragen wer- 

15 den und im Decoder ein geeigneter Austausch einzelner 
Teilbandsignale moglich ist. Die betreffenden Teilban- 
der der restlichen Tonkanale werden nicht ubertragen. 
Hierzu sind im Encoder und im Decoder Netzwerke 
("Kombinierer" bzw. "Dekombinierer rt ) vorgesehen, die 

20 nach MaBgabe von mitubertragenen Steuerinformatio- 
nen, die aus einer encoderseitigen Signalanalyse gebil- 
det werden und individuelle Teilbandsignale in demsel- 
ben Frequenzbereich einzelnen Tonkanalen zuweisen 
oder interkanalweise verknupfen. Wie im folgenden 

25 noch erlautert wird, ist es besonders vorteilhaft, die teil- 
band- und blockweise Reduktion der Kanaltrennung auf 
die Abtastwerte zu beschranken und die encoderseitig 
gewonnenen, als Nebeninformation ubertragenen, ur- 
sprUnglichen Skalenfaktoren der einzelnen Tonkanale 

30 fur die Ruckgewinnung der Teilbandsignalpegel einzu- 
setzen. 

Ein beispielhaftes Grundschema eines Encoders und 
Decoders fUr n Tonkanale geht aus den Fig. 1 und 2 
hervor. Im Encoder gemaB Fig. 1 werden die digitali- 

35 sierten, linear-quantisierten Tonsignale SI bis Sn einer 
Teilbandfilterbank 10 zugefuhrt und jeweils in i Teilban- 
der zerlegt Die resultierenden nxi Teilbandsignale 
durchlaufen nacheinander einen Kombinierer 11, einen 
Skalierer 12 so wie einen Quantisierer 13 und werden 

40 zusammen mit den in einer Analysestufe 15 gewonne- 
nen Nebeninformationen BAL (Bit-Zuwei- 
sungsbzw.-AllokationsinformationX COM (Kombinier- 
Modus-Information) und SCF (Skalenfaktoren) in einem 
Multiplexer 14 zu einem Multiplexsignal MUX zusam- 

45 mengefaBt. Dem Kombinierer 11 wird von der Analyse- 
stufe 15 ein Steuersignal COS zugeftihrt, welches im 
Kombinierer 11 eine interkanalweise Zusammenfas- 
sung individueller Teilbandsignale steuert. In dem Ska- 
lierer 12 werden die Abtastwerte nach MaBgabe der 

so Skalenfaktorinformation SCF normiert, wahrend in 
dem Quantisierer 13 nach MaBgabe der Bit-Zuwei- 
sungsinformation BAL die Quantisierung der normier- 
ten Abtastwerte erfolgt. Wie die Berechnung aller Ne- 
beninformationen zur Steuerung der Stufen 11. 12, 13 

55 durch die Analysestufe 15 erfolgt, wird spSter noch im 
einzelnen dargelegt. 

In dem Decoder gemaB Fig. 2 werden nach der Zerle- 
gung des empfangenen Datenstroms MUX in einem 
dem Demultiplexer 24 nachgeschalteten Dequantisierer 

60 23 die Abtastwerte der Teilbandsignale mit Hilfe der 
Ubertragenen Bit-Zuweisungsinformation BAL in nor- 
mierter Form zurUckgewonnen. Die zuruckgewonne- 
nen Abtastwerte werden nach MaBgabe der Kombi- 
nier-Modus-lnformation COM in einem Dekombinierer 

65 21 auf n Tonkanale teilbandweise aufgeteilt Erst danach 
erfolgt eine Multiplikation der Teilbandsignale mit den 
Skalenfaktoren SCF in Multiplizierstufen 22. Nach der 
inversen Filterung der entnormierten Teilbandsignale in 
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den Synthesefilterbanken 20 liegen an den Ausgangen 
des Decoders gemaB Fig. 2 die breitbandigen, digitali- 
sierten Tonsignale ST bis Sn' vor. 

Eine besondere Ausfuhrungsform des erfindungsge- 
mafien Verfahrens ist in den Fig. 3 und 4 dargestellt. 5 
Berucksichtigt ist hier die eingangs beschriebene Forde- 
rung der Kompatibilitat mit bestehenden Teilband-Co- 
dierern gemaB dem digitalen Standard ISO 1 1 172-3 so- 
wie die Forderung nach flexibler Nutzung der Tonuber- 
tragungskanale. Ausgegangen wird im Falle des Enco- 10 
ders nach Fig. 3 von fiinfkanaligen, stereofonen, digitali- 
sierten Tonsignalen, namlich 3 Frontsignalen Links (L), 
Rechts (R) und Center (C) sowie zwei Surroundsignalen 
Links-Surround (LS) und Rechts-Surround (RS). Aus 
Kompatibilitatsgrunden zu bestehenden Standard-Teil- 15 
band-Codierern werden die in Teilbandfiltern 30 in je- 
weils i Teilbander gefilterten Frontsignale L und R in 
einem Kombinierer 31 beispielsweise gemaB vorstehen- 
der Gleichungen (1) und (2) zu einem Zweikanal-Stereo- 
Basissignalpaket LoVRo' matriziert, welches in einer als 20 
Teiiband- Encoder und Standard-Multiplexer bezeich- 
neten Stufe 37 in bekannter Weise teilband-codiert und 
in einen standardisierten Bitstrom gemaB ISO-Standard 
11 172-3 unter Bildung eines kompatiblen Stereosignals 
MUXo umgewandelt wird. 25 

Die in Teilbandstufen 30 in jeweils i Teilbander gefil- 
terten Center- und Surround-Signale C, LS, RS werden 
in dem Kombinierer 31 beispielsweise gemaB Gleichun- 
gen (3) bis (5) zu einem teilbandgefilterten Zusatzsignal- 
paket T3/T4/T5 matriziert Dieses Zusatzsignalpaket 30 
T3/T4/T5 wird in gleicher Weise wie in Fig. 1 einer Ska- 
lierung (Skalierer 32), einer Quantisierung (Quantisierer 
33) und einer Multiplexbildung (Multiplexer 34) unter- 
zogen, wobei die Steuerung der Stufen 31, 32, 33 und 34 
wiederum durch eine Analysestufe 35 erfolgt. Im Ver- 35 
gleich zur Analysestufe 15 gemaB Fig. 1 erzeugt die 
Analysestufe 35 gemaB Fig. 3 zusatzlich eine Differenz- 
Skalenfaktorinformation A SCF sowie eine Konfigura- 
tionsinformation CFG, welche in das Multiplexsignal 
MUX des Multiplexers 34 eingefiigt werden. Die Analy- 40 
sestufe 35 erhalt von einer anwenderbedienten System- 
Konfigurations-Eingabe 36 eine applikationsabhangige 
Information iiber die Art der gewiinschten Verarbei- 
tung der Eingangssignale, beispielsweise eine Fiinfka- 
nal-Datenreduktion unter Berucksichtigung der stereo- 45 
fonen lrrelevanz aller Kanale (Surround-Tondarstel- 
lung) oder eine Codierung der Eingangssignale C, LS, 
RS unabhangig von den Frontsignalen L, R, beispiels- 
weise fur einen mehrsprachigen Fernsehton. LS, RS, C 
sind im letztgenannten Beispielsfall keine Surround-Ka- 50 
nale. sondern alternative Sprachkanale, wie an Hand 
von Fig. 5 noch erlautert wird- Zusatzlich zu den n teil- 
bandgefilterten Eingangssignalen erhalt die Analysestu- 
fe 35 die teilbandgefilterten Stereo-Basissignale Lo, Ro. 

Die vorgenannten Eingangssignale werden in der 55 
Analysestufe 35 entsprechend dem dort verwendeten 
psychoakustischen Modell und den daraus abgeleiteten, 
nachfolgend beschriebenen Kriterien analysiert. Ergibt 
die Analyse, daB eine Kanaltrennung subjektiv ntcht 
erforderlich ist, so wird eine Aufhebung der Kanaltren- 60 
nung dadurch erreicht, daB mit Hilfe der Bit-Zuwei- 
sungsinformation BAL bestimmte Teilbandsignale des 
Zusatzsignalpaketes C/LS/RS im Quantisierer 33 block- 
weise zu Null gesetzt werden. Die Bildung des Zusatz- 
Muhiplexsignals MUX im Multiplexer 34 umfaBt auch 65 
quellenbezogene FehlerschutzmaBnahmen. Die Diffe- 
renz-Skalenfaktorinformation A SCF besteht aus der 
Differenz zwischen den Skalenfaktoren SCFo der Teil- 


bander der Stereo-Basissignale Lo, Ro und den Skalenf- 
aktoren SCF der Teilbander der Zusatzsignale C, LS, RS 
und ermoglichen daher eine bitsparendere Codierung 
der Skalenfaktoren SCF. Anstelle einer expliziten Ober- 
tragung der Skalenfaktoren SCF im Multiplexsignal 
MUX gemaB Fig. 1 werden bei dem Encoder gemaB 
Fig. 3 nur die Differenzwerte A SCF ubertragen. 

Die resultierenden Bitstrome MUX und MUXo des 
Encoders gemaB Fig. 3 werden in beliebiger Weise in 
getrennten Datenpaketen ubertragen oder gespeichert. 
Am Ort des Decoders gemaB Fig. 4 muB gewahrleistet 
sein, daB beide Bitstrome MUX und MUXo zeitgleich 
verfiigbar sind. Es ist ferner mdglich, die resultierenden 
Bitstrome MUX und MUXo in einem ubergeordneten 
Multiplex zu ubertragen bzw. zu speichern. Hierzu wird 
beispielsweise. wie in Fig. 5 gezeigt ist, der Bitstrom 
MUX der Stufe 37 zugefuhrt, welche den Bitstrom 
MUX in geeigneter Weise in den Bitstrom MUXo unter 
Bildung des kombinierten Bitstroms MUXo* einfugt. 
Dies kann beispielsweise bei einem Datenstrom gemaB 
ISO-Standard 11 172-3 dadurch erfolgen, daB in jedem 
Audio- Datenrahmen innerhalb des Feldes, das fur pro- 
grammbezogene Daten reserviert ist, die MUX-Daten 
eingefiigt werden. 

In dem Decoder gemaB Fig. 4 werden aus dem Bits- 
trom MUXo in einer als "Standard- Demultiplexer und 
Teilband-Decoder" bezeichneten Stufe 47 in bekannter 
Weise die Teilbandsignale des Zweikanal-Stereo-Basis- 
signalpaketes LoVRo' zuruckgewonnen. Ferner werden 
aus dem Bitstrom MUX nach erfolgter Demultiplexbil- 
dung in einem Demultiplexer 44 die Teilbandsignale des 
Zusatzsignalpaketes mit Hilfe von Dequantisierern 43 
und Multiplizierern 42 zuruckgewonnen. Die hierzu 
notwendigen Skalenfaktoren SCF der Teilbandsignale 
C, LS, RS werden in einer Kontroll-Einheit 45 aus den 
von dem Demultiplexer 44 gelieferten Differenz-Ska- 
lenfaktorinformationen A SCF und den von der Stufe 47 
gelieferten Skalenfaktoren SCFo der Teilband-Basissi- 
gnale Lo, Ro errechnet. Wie im Falle von Fig. 2 werden 
die Dequantisierer 43 von der Bit-Zuweisungsinforma- 
tion BAL und die Multiplizierer 42 von den in der Kon- 
troll-Einheit 45 errechneten Skalenfaktoren SCF ge- 
steuert. 

Die decodierten Teilbandsignale Lo', Ro' am Aus- 
gang der Stufe 47 sowie die decodierten Teilbandsignale 
T3', T4' und T5' am Ausgang der Multiplizierer 42 ge- 
langen an den Dekombinierer 41, wo die bereits er- 
wahnte Kanalzuweisung oder die interkanalweise Ver- 
kniipfung der Teilbandsignale erfolgt, und zwar unter 
der Steuerung der Kontroll-Einheit 45, welche das Steu- 
crsignal COS aus den vom Demultiplexer 44 gelieferten 
Zusatzinformationen COM und CFG sowie aus einem 
Eingabesignal EIN errechnet. Das Eingabesignal EIN 
wird von einem Anwender iiber eine Wiedergabe-Kon- 
figurations-Eingabe 46 eingegeben; es reprasentiert die 
gewiinschte Abhorsituation sowie — im Falle des mehr- 
sprachigen Fernsehtons — die gewiinschte Wiederga- 
besprache. Desweiteren kann der Anwender iiber die 
Eingabe 46 Vorgaben iiber Pegelbalance und Abhordy- 
namik in die Kontroll-Einheit 45 eingeben, welche nach 
MaBgabe dieser Eingaben die dem Dekombinierer 41 
nachgeschalteten Gewichtungsstufen 48 steuert, welche 
die Teilbandsignale an den Ausgangen des Dekombinie- 
rers 41 blockweise mit entsprechenden Gewichtungs- 
faktoren GEW multiplizien. Nach der anschlieBenden 
inversen Filterung in den Synthesefilterbanken 40 liegen 
an den Ausgangen des Decoders gemaB Fig. 4 die breit- 
bandigen digitalisierten Tonsignale L', R', S3', S4' und 
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S5' vor. In dem Decoder gemaB Fig. 6 werden im Unter- 
schied zum Decoder gemaB Fig. 4 aus dem kombinier- 
ten Datenstrom MUXo* in der Stufe 47 der Datenstrom 
MUX sowie die Skalenfaktoren SCFo der Teilband-Ba- 
sissignale Lo, Ro abgetrennt und dem Demultiplexer 44 5 
zugefahrt Die direkte ZufUhrung von SCFo von der 
Stufe 47 zu der Kontroll-Einheit 45 (Fig. 4) entfallt; viel- 
mehr werden in Fig. 6 die Skalenfaktoren SCFo von 
dem Demultiplexer 44 der Kontroll-Einheit 45 zuge- 
fuhrt. Im ubrigen ist der Decoder gemaB Fig. 6 identisch to 
mit dem Decoder gemaB Fig. 4. 

Fur die nahere Eriauterung des erfindungsgemaBen 
Verfahrens an den Ausfuhrungsbeispielen gemaB Fig. 3 
bis 6 werden nachfolgend zunachst die der stereofonen 
Codierung zugrunde liegenden Gehdreigenschaften 15 
darstellt und darauf basierend die eingesetzten MaB- 
nahmen fur die Datenreduktion. Weitere Ausgestaltun- 
gen, insbesondere in Hinbiick auf eine flexible Nutzung 
der ObertragungskanaMe, werden abschlieBend be- 
schrieben. 2 o 

Modell der binauralen Signalverarbeitung 

Fur das raumliche Horen haben Unterschiede zwi- 
schen den Schallsignalen an beiden Ohren (interaurale 25 
Signaldifferenzen) eine hervorragende Bedeutung. In 
der Literatur werden mehrere Modelle unterschieden, 
die bereits eine weitreichende Beschreibung binauraler 
Effekte zulassen. Allerdings nehmen die Kenntnisse 
uber die zugrundeliegenden physiologischen Verarbei- 30 
tungsmechanismen immer mehr ab, je weiter man in die 
zentralen neuronalen Bereiche vordringt. Aus diesem 
Grunde sind die peripheren Stufen binauraler Modelle 
zumindest in ihrer grundsatzlichen Konzeption einheit- 
lich, wahrend die zentralen Modellbereiche entweder 35 
auf eng umgrenzte psychoakustische Effekte speziali- 
siert sind oder nur unscharfe Aussagen ermoglichen. Ein 
Modell der binauralen Signalverarbeitung zeigt Fig. 7. 
Die relativ genaue Beschreibung der peripheren Stufe 
durch die Bausteine A, B, C D sowie recht allgemeine 40 
Annahmen uber die Funktionsweise der zentralen Ver- 
arbeitungsstufe ("Binauraler Processor") erlauben eine 
grobe Erfassung der "binauralen Information". Das Mo- 
dell gemaB Fig. 7 enthalt folgende Stufen: 

AuBenohr-Filter: 45 
Die Wirkung des AuBenohres (Ohrmuschel, Kopf. 
Rumpf) auf das linke und rechte Ohrsignal ist durch 
AuBenohr-Obertragungsfunktionen (AuBenohr- Filter") 
beschrieben. Hierdurch erfolgt eine raumliche Zerle- 
gung sowie eine spektrale und zeitliche Filterung des 50 
Quellensignais im Sinne einer "raumlichen Codierung". 
Die Wirkung ist unterhaib etwa 150 Hz vernachlassig- 
bar, d. h. ent'sprechend tieffrequente Quellensignale sind 
hinsichtlich der binauralen Auswertung irrelevant. 

Periphere Stufe A: 55 
Es gilt nicht nur ftir die monaurale, sondern ebenso fur 
die binaurale Signalverarbeitung als erwiesen, daB die 
Auswertung jedes Ohrsignals frequenzselektiv ge- 
schieht. Das Gehor zerlegt die Ohrsignale in schmalban- 
dige Anteile f 1, f2 . . . fn. Die Analysebandbreite der be- &> 
treffenden Schmalband-Filter entspricht den Frequenz- 
gruppenbreiten, die bei monauralen Experimenten ge- 
messen werden, d. h. die auch physiologisch nachgewie- 
sene periphere Frequenzselektivitat wird sowohl bei 
monauraler als auch bei binauraler Signalverarbeitung 55 
wirksam. 

Periphere Stufe B: 
Ebenfalls physiologisch und psychoakustisch begriindet 


ist der folgende periphere Modellbaustein B zur Nach- 
bildung der neuronalen Eigenschaften. Die Ausgangssi- 
gnale der Haarzellen, welche in der Cochlea die mecha- 
nische Schwingungsform entlang der Basilarmembran 
abtasten, sind Folgen von Nervenimpulsen (Spikes), de- 
ren zeitliche Dichte in dem betreffenden Frequenzband 
mit wachsendem Signalpegel zunimmt ("Pulsfrequenz- 
modulation"). Zur Beschreibung der fur das Richtungs- 
horen wichtigen Eigenschaften der Nervenimpulsfolgen 
ist es in erster Naherung ausreichend, ein einfaches Re- 
ceptor-Neuronen-Modell aus Halbweggleichrichtung 
und anschlieBender TiefpaB filterung fur jede Frequenz- 
gruppe vorzusehen. Die Halbweggleichrichtung be- 
rucksichtigt, daB die Haarzellen nur auf eine Halbwelle 
der Basilarmembranschwingung ansprechen. Der Tief- 
paB 1. Ordnung mit einer Grenzfrequenz von ca. 800 Hz 
dient zur Gewinnung der Hiillkurve und berucksichtigt. 
daB die Aktivitatswahrscheinlichkeit der Neuronen mit 
.steigender Signalfrequenz mehr und mehr der Htillkur- 
ve und weniger der Feinstruktur der Basilarmembran- 
bewegung folgt, im Bereich tiefer Frequenzen dagegen 
Proportionalitat vorliegt. 

Periphere Stufe C: 
Die aus einem Dividierglied und einem ruckgekoppel- 
ten RC-Glied dargestellte, nichtlineare Stufe C bewirkt 
fiir stationare Signale eine Dynamikkompression. wah- 
rend schnelle Anderungen des Eingangssignals weitge- 
hend linear Qbertragen werden. Hierdurch werden zeit- 
liche Verdeckungseffekte (insbesondere Nachverdek- 
kung) nachgebildet; ferner ist die Stufe C ebenso fur 
wichtige binaurale Zeiteffekte primar verantwortlich 
(z. B. "Gesetz der ersten Wellenfronr, "Franssen-Ef- 
fekt M ). Die Zeitkonstante fur den Abfall der Hullkurve 
liegt im Durchschnitt etwa bei 50 ms, dagegen fur den 
Anstieg bei U5 ms - 1/800 Hz. Hierdurch ergibt sich 
eine hohe Informationsreduktion. 

Periphere Stufe D: 
Die Ausgangssignale der Stufe C werden in der periphe- 
ren Stufe D einer Zeit-Frequenztransformation (z. B. 
Fast-Fourier-Transformation) unterzogen, die die spek- 
tralen Eigenschaften der Hullkurve darstellt. Sie andern 
sich relativ langsam, was den Anderungen der Aktivi- 
tatszustande im akustischen Cortex entspricht. Die fre- 
quenzselektiven Ausgangssignale liegen als Muster der 
binauralen Verarbeitungsstufe (binauraler Processor) 
zeitgleich vor. 

Binauraler Processor: 
Fur die frequenzselektive Verarbeitung im binauralen 
Processor wird angenommen: 

1. Die Auswertung erfolgt durch Mustererken- 
nungsmechanismen, d. h. durch Vergleich des aktu- 
ellen Signalmusters mit einem Vorrat gespeicherter 
(erlernter) Muster. Dies ist ein ProzeB, der ein aktu- 
elles Signalmuster mit einem gespeicherten Muster 
verknupft, selbst dann, wenn nur Teile des gespei- 
cherten Musters im aktuellen Signalmuster enthal- 
ten sind oder wenn nur ein unvollstandiges aktuel- 
les Signalmuster vorliegt. 

2. Voraussetzung fur die Erkennung raumlicher Ei- 
genschaften ist Koharenz individueller kontralate- 
raler HOIIkurven-Signale, ("binaural envelope co- 
herence''), d. h. individuelle Htillkurvensignale vom 
linken und rechten Ohr mit gleicher Frequenzlage 
stellen Musterelemente dar, die hinsichtlich ihrer 
binauralen Information ausgewertet werden. 

3. Die so gewonnenen binauralen lnformationen 
werden den entsprechenden, in einem separaten 


<OE 4209&44A1_I_> 


DE 42 09 544 Al 


10 


MustererkennungsprozeB gewonnen, monauralen 
Informationen zugeordnet (oris- und gestaltsbe- 
stimmende Mustererkennung). 

Selektion der stereofonen Information 

In Hinblick auf die stereofone Codierung macht das 
Modell gemaB Fig. 7 zunachst die wichtige Aussage, 
daB die Selektion der stereofonen Information moglich 
ist, wenn die Auswertung frequenzselektiv erfolgt, d. h. 
wenn eine Zerlegung in (moglichst frequenzgruppen- 
breite) Teilbander vorgesehen wird. Die Eigenschaften 
der frequenzselektiven Signale an den Ausgangen der 
Stufen D sowie Eigenschaften der Mustererkennung ge- 
ben Hinweise fur die Codierung der stereofonen Zu- 
satzsignale in den Teilbandern. 

Eine hervorragende Bedeutung haben demnach die 
Hullkurven aller Teilbandsignale. Im Bereich hoherer 
Frequenzen (oberhalb etwa 1,5 kHz) lassen sie keine 
Auswertung der interauralen Phasendifferenzen zu. 
Dies ist sinnvoll, da oberhalb etwa 14 kHz die interaura- 
le Phasendifferenz kein eindeutiges Richtungsmerkmal 
mehr darstellt. Lateralisationssexperimente zeigen, daB 
im gesamten Horfrequenzbereich (ab etwa 150 Hz) in- 
teraurale Pege!- und Zeitdifferenzen der Hullkurven zu 
einer seitlichen Auslenkung des Horereignisses fuhren, 
dies aber bei interauralen Zeitdifferenzen der Signalf- 
einstrukturen nur im Frequenzbereich bis ca. i,5kHz 
geschieht. Mit amplitudenmoduliertem HochpaBrau- 
schen findet man selbst dann ein fusioniertes Horereig- 
nis, wenn interaural unkorreliertes Rauschen verwendet 
wird, sofern nur beide Ohrsignale die gleichen Hullkur- 
ven aufweisen. 

Diese Teilband-Hullkurvenauswertung bedeutet be- 
zUglich der stereofonen Codierung, daB die stereofone 
Information der oberen Teilbandsignale allein durch ih- 
re Hullkurven reprasentiert ist, und daB demzufolge die 
stereofonen Signale bei hoheren Frequenzen zusam- 
mengefaBt werden diirfen, wenn vorher die Hullkurven 
der oberen Teilbandsignale extrahiert worden sind. Die- 
se stereofone Information ist geeignet, im Decoder eine 
subjektiv ausreichende Kanaltrennung wiederherzu- 
stellen, indem die monofonen Teilbandsignale mit den 
urspriinglichen Hullkurven moduliert werden. Hier- 
durch entstehen sterofone Signale, die in hoheren Fre- 
quenzlagen sich nur bezuglich ihrer Hullkurven, nicht 
aber bezuglich der Signalfeinstruktur unterscheiden, 
und die dennoch ein unbeeintrachtigtes stereofones 
Klangbild sicherstellen. Voraussetzung dafur ist die hin- 
reichend genaue Reproduktion der Teilband- Hullkur- 
ven. Es hat sich bereits erwiesen, daB sogar bei grober 
zeitlicher Auflosung die resultierenden Qualitatsbeein- 
trachtigungen relativ gering sind. Sie lassen sich voll- 
kommen vermeiden, wenn die Reduktion der Kanal- 
trennung nur zeitweise und insbesondere im obersten 
Frequenzbereich haufiger erfolgt ais darunter. 

Im folgenden sollen die in dem binauralen Processor 
auftretenden zeitlichen Effekte und deren Auswertung 
bei der stereofonen Codierung betrachtet werden. Das 
zeitliche Verhalten der Signale an den Ausgangen der 
Stufe D sowie der ProzeB der Mustererkennung bewir- 
ken Einschrankungen der binauralen Zeitanalyse, die 
sich durch drei Effekte ausdriicken: 

— Der "Franssen-Effekt" besagt, daB zwei raumlich 
getrennte Schallereignisse ein einziges Horereignis 
am Ort desjenigen Lautsprechers erzeugen, wel- 
cher die Einschwingvorgange des einen Schaller- 
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eignisses abstrahlt Der eher stationare Teil des an- 
deren Schallereignisses ist fur die Richtungszuwei- 
sung irrelevant. 

— Das "Gesetz der ersten Wellenfront" besagt, daB 
zwei raumlich getrennte Schallereignisse ein einzi- 
ges Horereignis am Ort desjenigen Lautsprechers 
erzeugen, welcher das voreilende (impulsbehaftete) 
Tonsignal abstrahlt. Das verzogerte Tonsignal ist 
fur die Richtungszuweisung irrelevant. 

- Der "Tragheits-Effekt" besagt, daB Richtungsan- 
derungen bei vorwiegend stationaren Schallen erst 
ab einer bestimmten Anderungsdauer wahrschein- 
lich sind. Ein Stereosignal kann deshalb beispiels- 
weise kurzzeitig ( w weich ,> ) auf Mono geschaltet 
werden, ohne Storungen des stereofonen IClangbil- 
des zu verursachen. 


Es laBt sich als gemeinsames Merkmal der gesamten 
drei Effekte feststeilen, daB eine Reihe kurzzeitiger 
20 Schallereignisse irrelevant ist bezuglich raumlicher 
Wahrnehmbarkeit und daher als raumliche Information 
entbehrlich ist. Diese irrelevanten Schallereignisse sind 
sogar langer, je schmalbandiger sie sind. Die zeitliche 
Lage dieser irrelevanten Schallereignisse bzw. Tonsi- 
25 gnal-Abschnitte laBt sich anhand der Teilbandsignal- 
Hullkurvenverlaufe ermitteln; in erster Naherung liegen 
sie direkt hinter ihren Anstiegsflanken. 


Merkmale des Verfahrens 


30 


Der Kombinierer 31 im Encoder (Fig. 3 und 5) sowie 
der Dekombinierer 41 im Decoder (Fig- 4 und 6) ermog- 
lichen es, teilband- und blockweise beliebige Matrizie- 
rungen und Dematrizierungen vorzunehmen bzw. auf- 
35 zuheben. Hieraus ergeben sich einerseits vorteilhafte 
Mdglichkeiten der Datenreduktion und andererseits 
Moglichkeiten der alternativen Nutzung der Toniiber- 
tragungskanale, beispielsweise Obertragung alternati- 
ver Sprachen, abhangig von der Wahl der System-Kon- 
40 figuration mittels der Eingabe 36 (Fig. 3 und 5). 

System-Konfiguration A 

Diese System- ^Configuration reprasentiert die Daten- 
45 reduktion fur funfkanalige stereofone Signale, d. h., es ist 

53 - C 

54 - LS 

55 - RS. 

Der Kombinierer 31 im Encoder gemaB Fig. 3 und 5 
so matriziert die Signale L, R, C' f LS', RS' gemaB den Glei- 
chungen (1) bis (5), wahrend im Dekombinierer 41 des 
Decoders gemaB Fig. 4 und 6 die Dematrizierung ge- 
maB Gleichungen (6) bis (10) erfolgt. Die Datenreduk- 
tion geschieht durch folgende MaBnahmen: 

55 

1. Dynamisches Ubersprechen 

Eine hohe Datenreduktion fur das Zusatzsignalpaket 
T3rT4/T5 ist erreichbar, indem nach MaBgabe einer ge- 
60 eigneten Signalanalyse in der Analysestufe 35 in indivi- 
duellen Teilbandern die Dematrizierung blockweise 
aufgehoben wird. Dies geschieht mit Hilfe einer block- 
weisen sogenannten "Punktierung" von Teilbandsigna- 
len des Zusatzsignaipaketes T3/T4/T5 (Gleichungen (3), 
65 (4), (5)). Bei der Punktierung werden die Abtastwerte 
des entsprechenden Teilbandsignals encoderseitig im 
Kombinierer 31 und/oder Quantisierer 33 nach MaBga- 
be des Steuersignals COS und/oder der Bit-Zuwei- 
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sungsinformation BAL zu Null gesetzt. Decoderseitig 
werden die fehlenden Abtastwerte in den Teilbandern 
durch ubertragene Abtastwerte in den Teilbandern an- 
derer Tonkanale, jedoch gleicher Frequenzlage nach 
MaBgabe des Steuersignals COM substituiert. Die sub- 5 
stituierten Abtastwerte werden anschlieBend so in den 
Stufen 48 gewichtet, daB eine Anpassung an die ur- 
sprunglichen Teilbandsignalpegel-Verhaltnisse erfolgt. 
Zur Durchfiihrung dieser Anpassung wird der Gewich- 
tungsfaktor GEW (Fig. 3 und 5) in der Kontroll-Einheit 10 
45 aus den Skalenfaktoren SCF und dem Kombinier- 
Modus COM errechnet, beispielsweise mittels Interpo- 
lation aufeinanderfolgender Skalenfaktoren, urn "harte" 
Pegelsprunge zu vermeiden. 

Die Regeln ftir die Anwendung der Punktierung erge- 15 
ben sich aus verschiedenen Gehoreigenschaften, die im 
vorstehenden im Einzelnen erlautert worden sind. 
Grundsatzlich erfolgt die Punktierung in einer Weise. 
daB die fur die binaurale Signalverarbeitung relevante 
Information im Zusatzsignalpaket T3/T4/T5 erhalten 20 
bleibt. Somit lassen sich die im Stereo- Basissignalpaket 
Lo/Ro zusammengefaBten Einzeisignale decoderseitig 
den ursprunglichen Tonkanalen so weit zuordnen, daB 
das stereofone Klangbild subjektiv wieder hergestellt 
wird. 25 

Im Einzelnen werden die Tonsignale in der Analyse- 
stufe 35 hinsichtlich folgender Punktierungs-Kriterien 
analysiert: 
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tigen Oberlastung des Ubertragungskanals fur 
den Datenstrom MUx, kann das Gehor die da- 
durch verursachten Storungen in der raumli- 
chen Abbildung wahrnehmen. 
— Teilweise Nachbarkanal-Verdeckung 
Der bereits erwahnte Effekt der "Nachbarkanal- 
Verdeckung" kann nicht nur — wie im Folgenden 
noch im Einzelnen ausgefuhrt wird — zur Festle- 
gung der Quantisierung oder zur Unterdriickung 
einzelner Teilbandsignale ausgenutzt werden, son- 
de m auch als weiteres Punktierungs-Kxiterium 
herangezogen werden. Beispielsweise konnen sol- 
che Teilbander, die nur teilweise bzw. nicht voll- 
standig durch Nachbarkanale verdeckt werden, 
eher punktiert werden als solche Teilbander, die 
keiner Nachbarkanal-Verdeckung unterliegen. 

— Redundanz- Ausnutzung 

Aufgrund der Kompatibilitatsmatrizierung gemaB 
Gleichungen (1) bis (5) sind zeitweise einzelne Teil- 
bandsignale von Tl und/oder T2 mit entsprechen- 
den Teilbandsignalen gleicher Frequenzlage von 
T3, T4 und/oder T5 vollstandig oder nahezu iden- 
tisch. Aufgrund dieser Redundanz kann auf die 
Obertragung von identischen Teilbandsignalen 
gleicher Frequenzlage in dem Zusatzsignalpaket 
T3/T4/T5 verzichtet werden. Decoderseitig werden 
die punktierten Teilbandsignale des Zusatzsignal- 
Paketes T3/T4/T5 bei der Rekombination nur in 
ihrem ursprunglichen Tonkanal substituiert. Fehlt 
beispielsweise ein Teilbandsignal des Center 1 Ka- 
nals S3 im Zusatzsignal-Paket T3/T4/T5, so muB 
decoderseitig dafiir gesorgt werden, daB aus dem 
linken oder rechten Signal des Stereo-Basissignal- 
Paketes Lo/Ro nur in dem Center- Wiedergabeka- 
nal S3' substituiert wird, jedoch nicht in den beiden 
anderen Wiedergabekanalen S4' und S5' (Fig. 4). 
Dariiberhinaus mussen die Center-Anteile in den 
Stereo-Basissignalen Lo' und Ro' vom Dekombi- 
nierer 41 unterdriickt werden, da aufgrund des — 
fehlenden Center-Kanals die Dematrizierung ge- 
maB Gleichungen (6) bis (8) nicht mehr moglich ist. 

— Alias- Verzerrungen 

Infolge der durch die Punktierung bedingten, nicht- 
vollstandigen Rekonstruktion des Tonsignals im 
Decoder fmdet die Ausloschung der Alias-Verzer- 
rungen bei der Ruckfilterung in den Synthesefilter- 
banken 40 (Fig. 4 und 6) nicht vollstandig statt Die- 
se restlichen Alias- Verzerrungen lassen sich im En- 
coder vorherbestimmen, so daB ihre Maskierung 
berechnet werden kann. Bei fehlender Maskierung 
darf keine Punktierung erfolgen. 

— Negative {Correlation 

Tritt eine negative JCorrelation, d. h., Gegenphasig- 
keit, zwischen Teilbandsignalen gleicher Frequenz- 
lage auf, so hat dies bei der Matrizierung gemaB 
Gleichungen (1) und (2) zur Folge, daB in dem 
Links- oder Rechts-Signal des Stereo-Basissignal- 
Paketes Lo/Ro Ausloschungen auftreten. Diese 
Ausloschungen werden bei der Dematrizierung ge- 
maB Gleichungen (6) und (7) rUckgangig gemacht. 
Diese Ruckgangigmachung unterbleibt jedoch, 
wenn infolge einer Punktierung eines der Signale 
T3, T4 oder T5 nicht ubertragen wird. Aus diesem 
Grunde darf bei der Feststellung einer negativen 
Korrelation keine Punktierung erfolgen. 


— Teilbandsignal- Dynamik 30 
GemaB dem "Franssen- Effekt" und dem "Gesetz 
der 1. Wellenfront" konnen Teilbandsignalblocke 
punktiert werden, welche einem Transienten folgen 
und sich stationar oder quasi-stationSr verhalten. 

— Hullkurven-Auswertung 35 
Die Auswertung der Hullkurven der Teilbandsig- 
nale im binauralen Modell gemaB Fig. 7 erlaubt es, 
Punktierungen in Detailbandern hoherer Fre- 
quenzlage haufiger vorzunehmen als in den Teilb- 
dern tieferer Frequenzlage. 40 

— Signalenergie- Verhaltnisse 

Die Energie eines Teilbandes laBt sich aus dessen 
Skalenfaktoren SCF ableiten. Die Aufsummierung 
der Signalenergien samtlicher Teilbander ergibt die 
Signalenergie des gesamten Tonsignals. Durch 45 
Vergleich der Signalenergie der einzelnen Teilban- 
der mit der Signalenergie des gesamten Tonsignals 
laBt sich ein weiteres Kriterium fur die Punktierung 
ableitea Und zwar konnen Punktierungen in den- 
jenigen Teilbandern hSufiger erfolgen, in denen die 50 
Signalenergie bewegen auf die Signalenergie des 
gesamten Tonsignals realativ gering ist. Unter "re- 
lativ gering" versteht man beispielsweise ein Ver- 
haltnis von 1/i, wobei i die Anzahl der Teilbander je 
Tonkanal ist. 55 
— Tragheits-Effekt des menschlichen Gehors 
Wie vorstehend bereits erwahnt, versteht man un- 
ter dem Tragheits- Effekt" des menschlichen Ge- 
hors, daB Richtungsanderungen bei vorwiegend 
stationaren Schallen erst ab einer bestimmten An- $o 
derungsdauer wahrscheinlich sind. Daraus resultie- 
ren zwei Mdglichkeiten ftir eine Punktierung: 

a) Wird nur eine kurzzeitige Richtungsande- 
rung im Decoder dedektiert, konnen die dafiir 
verantwortlichen Teilbander dennoch punk- 65 
tiert werden. 

b) Wenn Punktierungen nur kurzzeitig erfol- 
gen, beispielsweise aus Grunden einer kurzzei- 
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2. Gemeinsame Mithorschwelle 

Die Bitzuweisung der Teilbandsignale in den einzel- 
nen Tonkanalen wird auf der Basis des Signal/Maskie- 
rungsabstandes bei einer Berucksichtigung aller Tonka- 5 
nale und aller i Teilbander berechnet. Unter Signal/ 
Maskierungsabstand wird das Verhaltnis von maxima- 
lem Teilbandsignalpegel zu minimaler Mithorschwelle 
in einem Teilband verstanden. 

Daher ist es notwendig, fiir jeden der Tonkanale den 10 
maximalen Signalpegel und die minimale Mithorschwel- 
le pro Teilband und pro zeitlichem Block zu bestimmen. 
Die minimale Mith6rschwelle wird in der Analysestufe 
35 (Fig. 3 und 5) aus einer der Teilbandfilterung parallel- 
geschalteten Fourieranalyse, der ein psychoakustisches 15 
Modell folgt, berechnet. Diese Parallelkonzeption hat 
den Vorteil, daB damit eine unzureichende Frequenz- 
zerlegung der Filterbank 30 kompensiert werden kann, 
da einerseits eine gute Spektralauflosung - gegeben 
durch die Fourieranalyse — fur die Bestimmung der 20 
spektralen Mithorschwellen notwendig ist und anderer- 
seits eine gute Zeitauflosung — gegeben durch die Fil- 
terbank 30 - der einzelnen Tonkanale gegeben ist. 

Durch diese Parallelkonzeption konnen auch Fre- 
quenzen und Pegel von Alias- Komponenten ermittelt 25 
werden, was besonders wichtig ist hinsichtlich der Ope- 
rationen, die durch den Kombinierer 31 (Fig. 3 und 5) 
durchgefuhrt werden. Die Entscheidungen dieser spe- 
ziellen Signalanalyse in 35 werden in das Steuersignal 
COS, das den Kombinierer 31 steuert, miteingefiigt. 30 

Zum Beispiel haben Experimente gezeigt, daB fur den 
zeitlichen Block zur Berechnung der Mithorschwelle et- 
wa 24 ms ausreichen, was bei einer Abtastfrequenz der 
Tonkanale von 48 kHz 1152 Eingangs-PCM Werten 
entspricht und einen guten KompromiB zwischen zeith- 35 
cher Folge des Tonsignals und/oder baulicher Komple- 
xitat der Analysestufe 35 darstellt 

Die Berechnung der genaueren Frequenzauflosung 
ist jedoch nur encoderseitig notwendig, nicht jedoch im 
Decoder, was fiir eine Massenproduktion von Decodern 40 
wichtig ist. 

Die Berechnung der gemeinsamen Mithorschwelle 
und des davon abgeleiteten Signal/Maskierungsabstan- 
des beruht auf folgenden Schritten: 

45 


l.Schritt 

Berechnung der Fouriertransformation zur Zeit/ 
Frequenztransformation der einzelnen Tonkanalsi- 
gnale. 

2. Schritt 50 
Bestimmung des Signalpegels in jedem Teilband 
fur jedes Tonkanalsignal. 

3. Schritt 

Bestimmung der Ruhehorschwelle, wobei je nach 
Qualitatsanforderung ein zusatzlicher Sicherheits- 55 
spielraum zur Erhohung der Obertragungsdynamik 
eingesetzt wird. 

4. Schritt 

Bestimmung der tonalen, d. h. durch einen reinen 
Ton reprasentierten Komponenten und der rnehr 60 
gerauschhaften Anteile eines Tonkanals, um eine 
Unterscheidung in tonale Maskierer und Rau- 
schmaskierer verf ugbar zu haben. 

5. Schriti 

Reduzierung der tonalen und gerauschhaften Kom- 65 
ponenten auf gehdrphysiologisch relevante Anteile 
durch Berucksichtigung der gegenseitigen Verdek- 
kung dieser Komponenten und der Verdeckung 


durch die Ruhehorschwelle. 

6. Schritt 

Berechnung der individuellen, d. h. einzelnen Mit- 
horschwellen der relevanten Anteile der tonalen 
und gerauschhaften Komponenten. 

7. Schritt 

Bestimmung der globalen Mithorschwelle pro Ton- 
kanal. 

8. Schritt . . 
Bestimmung der minimalen Mithorschwelle in je- 
dem Teilband pro Tonkanal. 

9. Schritt 

Bestimmung des maximalen Wertes aller minima- 
len Mithorschwellen in Teilbandern gleicher Fre- 
quenzlage der unmatrizierten Tonkanalsignale L, 
R,C, LS, RS. 

10. Schritt 

Berucksichtigung des Effektes einer reduzierten 
Verdeckung bei raumlich getrennten Maskierern 
("Masking Level Difference" - MLD) bei der Be- 
stimmung des maximalen Wertes gemaB Schritt 9 
im Sinne einer Verringerung des ermittelten maxi- 
malen Wertes. 

11. Schritt 

Berucksichtigung einer Ausdehnung der Abhorzo- 
ne bei der Bestimmung des maximalen Wertes ge- 
maB Schritt 9 und 10. Da die Berechnung der MLD 
grundsatzlich nur fiir einen einzigen Abhorort Giil- 
tigkeit hat, wird der nach Schritt 9 und 10 ermittelte 
Maximalwert der gemeinsamen Mithorschwelle 
zusatzlich reduziert. 

System-Konfiguration B 

Diese System-Konfiguration wird reprasentien zum 
einen durch eine Datenreduktion bekannter Art fur die 
zweikanaligen stereofonen Signale L und R und zum 
anderen durch eine davon vollig unabhangige Datenre- 
duktion fur die Kanale S3, S4 und S5. Die Kanale S3, S4 
und S5 konnen dabei voneinander unabhangige Pro- 
gramminhalte aufweisen, beispielsweise als reine Kom- 
mentar-Kanale genutzt werden; sie konnen aber auch 
ein weiteres stereofones Tonsignalpaar und einen unbe- 
nutzten oder einen beliebigen anderen Tonkanal umfas- 
sen. In dem Kombinierer 31 erfolgt bei der System-Kon- 
figuration B keine Matrizierung der Tonkanale, d. h., der 
Kombinierer 31 ist funktionslos. In der Analysestufe 35 
erfolgt nicht rnehr die Berechnung einer gemeinsamen 
Mithorschwelle fur die Kanale S3 bis S5; vielmehr wird 
far jeden einzelnen Kanal S3 bis S5 die individuelle 
Mithorschwelle berechnet, woraus entsprechend unter- 
schiedliche Bit-Zuweisungsinformationen BAL fur die 
Quantisierungsstufen 33 generiert werden. Desweiteren 
unterbleibt in der Analysestufe 35 eine Datenreduktion 
nach den Regeln des dynamischen Obersprechens 
(Punktierung). Besonders vorteilhaft fiir die Konfigura- 
tion B ist der Encoder gemaB Fig. 5, bei welchem der 
Datenstrom MUX in den Datenstrom MUXo einge- 
mischt wird. Samtliche funf Tonkanalsignale, deren Bit- 
fluB jeweils zeitlich variiert, werden in einen gemeinsa- 
men, festen Datenrahmen eingefiigt. Da sich im statisti- 
schen Mittel die BitfluBschwankungen der fiinf Tonka- 
nale naherungsweise kompensieren, ergibt sich eine 
verbesserte Ausnutzung der Obertragungs- oder Spei- 
cherkapazitat des kombinierten Datenstromes MUXo*. 

Auf der Decoderseite kann der Dekombinierer 41 bei 
der System-Konfiguration B als Kanalselektor und als 
Kanalmischer eingesetzt werden, je nach Steuerung der 
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Kontroll-Einheit 45 durch die Wiedergabe-Konfigura- 
tionseingabe 46. 

Desweiteren erzeugt die Analysestufe 35 des Enco- 
ders bei der System-Konfiguration B keine Differenz- 
Skalenfaktorwerte A SCF; anstelle dessen werden die 5 
Skalenfaktorwerte SCF der Kanale S3 bis S5 an den 
Multiplexer 34 gegebenenfalls in codierter Form weiter- 
geleitet. Encoderseitig werden von der Kontroll-Einheit 
45 die Skalenfaktoren SCFo ignoriert. 

10 

Patentanspriiche 

1. Verfahren zum Obertragen oder Speichern digi- 
talisierter, mehrkanaliger Tonsignale, bei dem en- 
coderseitig 15 

a) jedes Tonsignal durch eine Vielzahl spektra- 
ler Teilbandsignaie digital dargestellt wird, 
wobei for jedes Teilbandsignal zeitdiskrete, 
quantisierte Abtastwerte vorliegen; 

b) die Quantisierung der Abtastwerte in den 20 
einzelnen Teilbandern nach MaBgabe der ka- 
nalspezifischen Intra-Kanal-Mithorschwelle 
des menschlichen Gehors im Sinne einer Irre- 
levanzreduktion geandert (codiert) wird; 

c) fur jedes Teilbandsignal ein Skalenfaktor 25 
(SCF) bestimmt wird, welcher den Spitzenwert 
des Teilbandsignals innerhalb eines bestimm- 
ten Zeitintervalls (Blocks) klassiert und wel- 
cher zur Normierung des Teilbandsignals vor 
der Quantisierung benutzt wird ; 30 

d) fur die Steuerung der Quantisierung der Ab- 
tastwerte jedes Teilbandsignals aus einer Ton- 
signalanalyse eine Bit-Zuweisungsinformation 
(BAL) gewonnen wird, welche zusammen mit 
den ermittelten Skalenfaktoren (SCF) und mit 35 
den codierten Teilbandsignalen gespeichert 
bzw. ubertragen werden, und bei dem deco- 
derseitig 

e) die codierten Teilbandsignaie nach MaBga- 
be der Bit-Zuweisungsinformation (BAL) de- 40 
codiert und die Teilbandsignalpegel nach 
MaBgabe der Skalenfaktoren (SCF) entnor- 
miert werden; 

f) die decodierten und entnormierten Teil- 
bandsignaie jedes Tonkanals zu einem breit* 45 
bandigen, digitalen Tonsignal zusammenge- 
setzt werden. dadurch gekennzeichnet, daB 

g) encoderseitig die Teilbandsignaie verschie- 
dener Tonkanale, jedoch gleicher Frequenzla- 
ge interkanalweise nach MaBgabe eines dyna- 50 
mischen Steuersignals (COS) kombiniert wer- 
den, welches durch eine an einem binauralen, 
psychoakustischen Modell orientierten Tonsi- 
gnalanalyse von mehreren Tonkanalen ge- 
wonnen wird, und 55 

h) decoderseitig die Teilbandsignaie verschie- 
dener Tonkanale, jedoch gleicher Frequenzla- 
ge interkanalweise in Abhztngigkeit von einer 
SteuergroBe (COM) dekombiniert werden, 
welche von dem dynamischen Steuersignal 60 
(COS) abgeleitet und mitiibertragen bzw. mit- 
gespeichert wird. 

2. Verfahren nach Anspruch 1, dadurch gekenn- 
zeichnet, daB encoderseitig mit Hilfe des Steuersi- 
gnals (COS) und/oder der Bit-Zuweisungsinforma- 65 
tion (BAL) eine Punktierung von Teilbandsignalen 
erfolgt, bei der die Abtastwerte des betreffenden 
Teilbandsignals nicht Obertragen bzw. gespeichert 
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werden, und daB decoderseitig die nichtubertrage- 
nen bzw. nicht-gespeicherten Abtastwerte in den 
Teilbandern durch Obertragene bzw. gespeicherte 
Abtastwerte in den Teilbandern anderer Tonkana- 
le, jedoch gleicher Frequenzlage nach MaBgabe 
der SteuergroBe (COM) substituien werden, wobei 
die substituierten Abtastwerte hinsichtlich ihrer 
Pegel an die ursprunglichen Pegelverhahnisse an- 
gepaBt werden. 

3. Verfahren nach Anspruch 2 t dadurch gekenn- 
zeichnet, daB fur die Pegelanpassung aus den Ska- 
lenfaktoren (SCF) Gewichtungsfaktoren (GEW) 
errechnet werden, mit welchen die substituierten 
Abtastwerte gewichtet werden. 

4. Verfahren nach Anspruch 2 oder 3, dadurch ge- 
kennzeichnet, daB die Punktierung in Abhangigkeit 
von der Erfassung einer Aufeinanderfolge von ei- 
nem transienten und einem stationSren Signalzu- 
stand desselben Tonkanals oder benachbarten 
Tonkanale erfolgt 

5. Verfahren nach einem der Anspruche 2 bis 4, 
dadurch gekennzeichnet, daB die Punktierung in 
den Teilbandern hdherer Frequenzlage haufiger 
erfolgt als in den Teilbandern tieferer Frequenzla- 
ge. 

6. Verfahren nach einem der Anspruche 2 bis 5, 
dadurch gekennzeichnet, daB die Punktierung in 
denjenigen Teilbandern haufiger erfolgt, in denen 
die Signalenergie bezogen auf die Signalenergie 
des gesamten Tonsignals relativ gering ist. 

7. Verfahren nach einem der Anspruche 2 bis 6, 
dadurch gekennzeichnet, daB die Punktierung un- 
ter Ausnutzung des Tragheitseffektes des menschli- 
chen Gehors erfolgt. 

8. Verfahren nach einem der Anspruche 2 bis 7, 
dadurch gekennzeichnet, daB die Punktierung un- 
ter Ausnutzung der psychoakustischen Verdek- 
kung von benachbarten Tonkanalen erfolgt. 

9. Verfahren nach einem der Anspruche 2 bis 7, 
dadurch gekennzeichnet, daB die Punktierung un- 
ter Ausnutzung von Redundanz in Teilbandern 
gleicher Frequenzlage von benachbarten Tonkana- 
len erfolgt, wobei decoderseitig die punktierten 
Teilbandsignaie bei der Rekombination nur in ih- 
rem ursprunglichen Tonkanal substituiert werden. 

10. Verfahren nach einem der Anspruche 2 bis 9, 
dadurch gekennzeichnet, daB die Punktierung nur 
dann erfolgt, wenn encoderseitig festgestellte Ali- 
as-Verzerrungen bezuglich der menschlichen Ge- 
horeigenschaften irrelevant sind. 

11. Verfahren nach einem der Anspruche 2 bis 10, 
dadurch gekennzeichnet, daB die Punktierung un- 
terbleibt, wenn zwischen Teilbandsignalen gleicher 
Frequenzlage eine negative Korrelation vorliegt. 

12. Verfahren zum Obertragen oder Speichern digi- 
talisierter, mehrkanaliger Tonsignale, bei dem en- 
coderseitig 

a) das Tonsignal jedes Tonsignals durch eine 
Vielzahl spektraler Teilbandsignaie digital dar- 
gestellt wird, wobei fur jedes Teilbandsignal 
zeitdiskrete, quantisierte Abtastwerte vorlie- 
gen; 

b) die Quantisierung der Abtastwerte in den 
einzelnen Teilbandern nach MaBgabe der ka- 
nalspezifischen Imra-Kanal-Mithdrschwelle 
des menschlichen Gehors im Sinne einer Irre- 
levanzreduktion geandert (codiert) wird ; 

c) fur jedes Teilbandsignal ein Skalenfaktor 
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(SCF) bestimmt wird, welcher den Spitzenwert 
des Teilbandsignals innerhalb eines bestimm- 
ten Zeitintervalls (Blocks) klassiert und wel- 
cher zur Normierung des Teilbandsignals vor 
der Quantisierung benutzt wird; 5 

d) fur die Steuerung der Quantisierung der Ab- 
tastwerte jedes Teilbandsignals aus einer Ton- 
signalanalyse eine Bit-Zuweisungsinformation 
(BAL) gewonnen wird, welche zusammen mit 
den ermittelten Skalenfaktoren (SCF) und mit io 
den codierten Teilbandsignalen gespeichert 
bzw. iibertragen werden, und bei dem deco- 
derseitig 

e) die codierten Teilbandsignale nach MaBga- 
be der Bit-Zuweisungsinformation (BAL) de- 15 
codiert und die Teilbandsignalpegel nach 
MaBgabe der Skalenfaktoren (SCF) entnor- 
miert werden; 

f) die decodierten und entnormierten Teil- 
bandsignale jedes Tonkanals zu einem breit- 20 
bandigen, digitalen Tonsignal zusammenge- 
setzt werden, dadurch gekennzeichnet, daB fiir 
den Fall einer stereofonen Interkorrelation 
von Tonkanalen (Lo, Ro, C L, S, R, S) encoder- 
seitig die Quantisierung der Teilbandsignale 25 
der stereofon interkorrelierten Tonkanale 
nach einer von einer gemeinsamen Mithor- 
schwelle abgeleiteten Steuerinformation 
(BAL) erfolgt, wobei die gemeinsame Mithor- 
schwelle aus den individuellen Mithorschwel- 30 
len aller betrachteten Tonkanale gebildet wird, 
und daB decoderseitig die Dequantisierung der 
Teilbandsignale der stereofon interkorrelier- 
ten Tonkanale in Abhangigkeit von der Steu- 
erinformation (BAL) erfolgt, welche mituber- 35 
tragen bzw. mitgespeichert wird. 

13. Verfahren nach Anspruch 12, dadurch gekenn- 
zeichnet, daB die gemeinsame Mithorschwelle un- 
ter Beriicksichtigung des Maskierungsunterschie- 
des bei stereofoner Wiedergabe berechnet wird. 40 

14. Verfahren zum Obertragen oder Speichem digi- 
talisierter, mehrkanaliger Tonsignale. bei dem en- 
coderseitig 

a) das Tonsignal jedes Tonsignals durch eine 
Vielzahl spektraler Teilbandsignale digital dar- 45 
gestellt wird, wobei fiir jedes Teilbandsignal 
zeitdiskrete, quantisierte Abtastwerte vorlie- 
gen; 

b) die Quantisierung der Abtastwerte in den 
einzelnen Teilbandern nach MaBgabe der ka- 50 
nalspezif ischen Intra-Kanal- Mithorschwelle 
des menschlichen Gehors im Sinne einer Irre- 
levanzreduktion geandert (codiert) wird; 

c) fiir jedes Teilbandsignal ein Skalenfaktor 
(SCF) bestimmt wird, welcher den Spitzenwert 55 
des Teilbandsignals innerhalb eines bestimm- 
ten Zeitintervalls (Blocks) klassiert und wel- 
cher zur Normierung des Teilbandsignals vor 
der Quantisierung benutzt wird; 

d) fiir die Steuerung der Quantisierung der Ab- &o 
tastwerte jedes Teilbandsignals aus einer Ton- 
signalanalyse eine Bit-Zuweisungsinformation 
(BAL) gewonnen wird, welche zusammen mit 
den ermittelten Skalenfaktoren (SCF) und mit 
den codierten Teilbandsignalen gespeichert 65 
bzw. iibertragen werden, und bei dem deco- 
derseitig 

e) die codierten Teilbandsignale nach MaBga- 
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be der Bit-Zuweisungsinformation (BAL) de- 
codiert und die Teilbandsignalpegel nach 
MaBgabe der Skalenfaktoren (SCF) entnor- 
miert werden; 

f) die decodierten und entnormierten Teil- 
bandsignale jedes Tonkanals zu einem breit- 
bandigen, digitalen Tonsignal zusammenge- 
setzt werden, dadurch gekennzeichnet, daB en- 
coderseitig die Teilbandsignale verschiedener 
Tonkanale, jedoch gleicher Frequenzlage in- 
terkanalweise in Abhangigkeit des entspre- 
chend der Systemkonfiguration gewahlten 
Tondarstellungsformates der Tonkanale kom- 
biniert werden, und daB decoderseitig die Teil- 
bandsignale verschiedener Tonkanale, jedoch 
gleicher Frequenzlage interkanalweise in Ab- 
hangigkeit eines Steuersignals (CFG) dekom- 
biniert werden, welches von dem gewahlten 
Tondarstellungsformat abgeleitet und mit- 
Obertragen bzw. mitgespeichert wird. 
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